作者:robot 发表时间:2018-01-22 18:29:37 转载自:投中网
“500页的招股说明书,一个投行分析师进行全面复核需要至少2天。他需要将文件从头读到尾,看哪里有错误。一旦对某个数字有疑问,还要来回比对,这是个很繁琐的过程。” 庖丁科技董事长林得苗告诉小编,对很多“金融民工”来说,职业生涯的前几年,复核文件这种基础类事务占据了他们工作的大部分,成为很多人的痛点。
庖丁科技推出金融文档结构化应用,希望通过AI技术解构文本,最终实现计算机对文本内容的智能甄别、关联、分析和预判,推动金融机构业务线的自动化和智能化。2017年8月,庖丁科技获得Pre-A轮融资,目前正在筹备第二轮融资。
三个“臭皮匠”的AI创业路
金融是个文档密集型行业。除了基金、券商、会计师事务所等金融机构需要大量文件的撰写、检测和复盘,其他行业和金融也紧密相关,产生了大量公开或非公开金融文档,记录了相关行业的各类活动。
金融行业的高风险性,要求其文档准确、严谨并且完整。拿IPO申请书来说,文档中的某个细微错误,轻会带来经济赔偿,重会导致上市失败。因此,为了将文件的错误率降到最低,相关机构需要大量经过训练的金融人才。不过,即使经过训练,在这种程式化的工作上,因为精力有限,人不免还是会有很多错误。
因为身边很多朋友都是投行人士,庖丁科技创始人之一、董事长林得苗对这些痛点感同身受。这个清华大学计算机系硕士毕业,曾在惠普中国实验室担任研究员的持续创业者,希望能借助AI技术,解决金融行业的这些痛点;现任中科院计算技术研究所博士生导师的罗平,则认为AI技术已发展到一定程度,希望能找到技术的落地领域;同时,金融行业资深人士——曾供职于加拿大鲍尔集团、香港联交所等的高大光,希望能在金融和AI领域找到创业方向。
当这三个“臭皮匠”相遇,一拍即合,便创立了庖丁科技。目前,庖丁团队大概有50人,技术占比超过95%。
庖丁科技推出的金融文档结构化应用,是在数据资源的基础上,通过深度学习,让计算机读懂文档语义,实现智能复核、甄别等。其核心产品AutoDoc的主要功能是金融文档内容及数据复核。用户上传需要复核的文档后,机器经过自动解析和比对,会标注出数据不一致的地方。
比如,其AI模型可以研读沪深证券交易所上市公司披露的年度报告,进行遗失披露、不及时披露、补充更正等问题的甄别。目前其产品只需要20分钟,就可以生成准确率达99.9%的纠错报告。
在这个过程中,为了让计算机读懂几百页的PDF文件,需要经过自然语言结构化、表格语意数字化等训练。其中的关键在于,让AI理解文字和表格等自然语言,以及其背后的语意。比如,表格二维布局中不同数字的内在关系;同一个指标在不同报表中的不同含义等。这些都是AI需要学会的部分。
“AI数据是否准确,除了模型本身是关键,还要有大量精标数据。除此之外,产品一定要给用户使用,获得动态的反馈。这三方面缺一不可。”庖丁科技首席科学家罗平强调。
庖丁科技首席科学家罗平
在“喂给”AI用于训练的数据中,除了大量公开金融文件,还有上百万人工标注的精标性数据以及部分来自券商或企业内部的数据模型。这些都成为公司构建技术壁垒的重要基础。
AI公司未来是新的金融机构
“有一个券商董事长,特别在意错别字,他认为邮件或文件里的错别字是不认真的行为。他希望我们能帮他们先把错别字找出来。”林得苗透露。
目前,To B是庖丁科技最重要的商业模式,国内外金融机构和金融监管机构是其最主要的合作对象。除了挑错,B端用户还有多元需求,“部分客户希望在内部数据不泄露的情况下,能打通内外部数据,对二者进行抽取和结构化比对,最终进行逻辑推理和预判。”
考虑到用户需求,庖丁科技和B端用户有多种合作模式,包括按次付费和按软件付费。公司会到相关机构进行系统部署,帮助其进行后续升级等。考虑到数据隐私问题和AI系统的反馈需求,券商等B端客户或给庖丁科技提供脱敏过的数据,而非系统中的完整数据。除了To B模式,公司业务还面向C端:目前,所有用户都可以在其网站上传文档,进行免费试用产品。在公司CEO高大光看来,这是公司教育客户的重要策略。
不过,“向金融机构等销售AI产品只是公司发展的第一步,公司最终的目标是成为中国的Palantir”,林得苗称。Palantir是美国最大的大数据公司,旗下有专注于金融领域的Palantir Metropolis平台。Palantir尝试通过AI数据,搭建资本图谱,成为金融行业的底层图谱提供商。
“传统投资机构最害怕什么?不是其他资产管理机构,而是谷歌,Facebook等互联网公司,他们害怕AI最后能取代人来投资,但这是不可逆的趋势。AI公司未来会是新的金融机构。未来,庖丁科技要做的,是成为新的资产管理机构。” 高大光强调。
据他透露,在公司AI系统审核的招股书、债权书等文本背后,是诸多行业的专业信息和数据。在这些金融数据的基础上,公司可以建立算法模型,了解行业背后的风险,帮助相关机构进行投资和决策。比如,帮助银行建立企业资质图谱等。
庖丁科技CEO高大光透露,目前,中国很多金融机构都希望能够加速智能化,因此对AI技术抱有很大热情,这是庖丁科技的机会所在。2016年,中国传统金融机构的IT投入约为千亿元。除了买电脑等,它们在智能化上的投入不到1%(10亿元),而全球在2016年的这一支出大约为4800亿美元。据其估计,2020年,中国传统金融机构在智能化上的投入占比将超过20%。
无人机测绘爆款来袭!大疆行业应用携DJI L1和DJI P1闪耀2020 InterGEO
与创新极客共成长——极客公园创新大会十周年「极致成长论坛」成功举办
共创共享 共商共赢 2022世界机器人大会将于8月18日至21日举办
生物机器人以及生物学、科学和工学之间前沿
中国机器人产业发展报告(2019)
盛会将至!2022世界机器人大会将于8月18日在京开幕